由于结构化数据通常不足,因此在开发用于临床信息检索和决策支持系统模型时,需要从电子健康记录中的自由文本中提取标签。临床文本中最重要的上下文特性之一是否定,这表明没有发现。我们旨在通过比较荷兰临床注释中的三种否定检测方法来改善标签的大规模提取。我们使用Erasmus医疗中心荷兰临床语料库比较了基于ContextD的基于规则的方法,即使用MEDCAT和(Fineted)基于Roberta的模型的BilstM模型。我们发现,Bilstm和Roberta模型都在F1得分,精度和召回方面始终优于基于规则的模型。此外,我们将每个模型的分类错误系统地分类,这些错误可用于进一步改善特定应用程序的模型性能。在性能方面,将三个模型结合起来并不有益。我们得出的结论是,尤其是基于Bilstm和Roberta的模型在检测临床否定方面非常准确,但是最终,根据手头的用例,这三种方法最终都可以可行。
translated by 谷歌翻译
神经影像学技术产生高维的随机数据,从中提取有关感兴趣现象的高级知识可能是具有挑战性的。我们通过将生成建模框架应用于1)分类多种病理和2)以数据驱动方式来解决这些挑战。我们的框架学习了与病理有关的数据的生成因素。我们提供了一种算法来进一步解码这些因素,并观察不同的病理如何影响观察到的数据。我们说明了拟议方法在识别精神分裂症的适用性,然后是听觉语言幻觉。我们进一步证明了该框架学习与当前领域知识一致的疾病相关机制的能力。我们还将所提出的框架与几种基准方法进行比较,并表明其分类性能和解释性优势。
translated by 谷歌翻译